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Об'єктно-елементна модель подання 
інформації для задачі конкатенативного 
сегментивного синтезу української мови 


У статті наводиться модель подання інформації для задачі конкатенативного сегментивного синтезу 
української мови. Демонструється підхід у виборі об'єктів та елементів синтезу. Аналізується структура 
об'єктів та елементів синтезу бази даних системи конкатенативного сегментивного синтезу української мови. 


Вступ 


Синтез природних мов є важливим функціональним компонентом систем штучного 
інтелекту, оскільки підвищує інтелектуалізацію людино-комп'ютерного інтерфейсу та 
надає доступ до природного для людини способу спілкування. 

Метою сучасних систем синтезу природної мови є озвучення інформації з якнай- 
природнішим наближенням характеристик звучання до голосу людини. 

На сьогоднішній день в Україні активно досліджують та успішно вирішують 
проблеми синтезу та розпізнавання голосових мовних сигналів в Українській асоціації з 
оброблення інформації та розпізнавання образів при МННЦІТС ||, в Державному 
університеті інформатики і штучного інтелекту |2|, в Інституті кібернетики імені 
В.М. Глушкова НАН України (31, в Київському національному університеті імені Тараса 
Шевченка |4) та ін. 

Для вирішення задачі побудови систем природного синтезу мови слід опрацювати 
ряд наукових проблем, серед котрих особливо важливими є такі - дослідження сприй- 
няття слухачем характеристик звучання синтезованих мовних сигналів та адекватне 
розуміння озвученої інформації; обробка, подання та інтерпретація вхідної інформації 
для озвучення; розробка множин елементів синтезу та характеристик їх звучання та ін. 

Важливою підзадачею створення систем природного синтезу мови є розробка при- 
наймні таких програмних засобів, як засоби обробки та налаштування вхідної текстової та 
голосової інформації для створення вибірок мовної інформації згідно з моделлю синтезу 
мови; засоби розробки, зберігання та використання баз даних елементів синтезу; засоби 
озвучення обробленої вхідної текстової інформації, використовуючи бази даних елемен- 
тів синтезу. 


Методи конкатенативного синтезу мови 
в сучасних системах озвучення текстової інформації 


При виборі елементів синтезу необхідно враховувати велику кількість фонетичних 
коартикуляційних властивостей елементів мови, зокрема, таких як: 
- акустичні особливості 1 характеристики ізольованих звуків та звуків у слові; 
- просодичні характеристики та інтонаційні властивості природної мови в залежності від 
їх розташування в слові, а також їх пом'якшення, подвоєння й ін.; 
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-- вплив акцентованості і наголосу на частотні характеристики мови; 
- суперсегментні явища та характеристики частоти основного тону; 
- структуризацію пари «об'єкт синтезу - елемент синтезу». 

Встановлено, що фізіологічний тремор м'язів гортані створює невеликі випадкові 
зміни їх напруження, які впливають на сприйняття мови |51. 

В залежності від елементів синтезу, що використовуються при генеруванні голо- 
сових мовних сигналів в сучасних системах озвучення текстової інформації, виділяються 
такі методи конкатенативного синтезу. 

1. Алофонний конкатенативний синтез. 

У мовному потоці фонеми реалізуються як алофони, іншими словами, як позиційні 
та комбінаторні відтінки фонем. Позиційний фактор враховує позицію даної фонеми від- 
носно мовленнєвого, акцентно-групового, синтагматичного та фразового наголосу. Ком- 
бінаторний фактор враховує найближче фонемне оточення (6. 

2. Дифонний конкатенативний синтез. 

Елементами синтезу є звукові мовні одиниці, що містять половину приголосного та 
половину голосного звуку, що примикає до нього. Саме коартикуляційні переходи між 
фонемами містять переважну більшість семантичного навантаження в слові. 

3. Складовий конкатенативний синтез. 

Елементами синтезу зазвичай є склади (частіше лише відкриті) та фонеми. Можливе 
використання як з'єднуючих мовних елементів алофонів та дифонів. 

4. Трифонний. 

Трифони - мовні фонетичні одиниці, що починаються з середини стаціонарної 
частини вокалізованого звуку, містять перехідні частини з першого звуку до другого та з 
другого до третього, всю стаціонарну частину другого звуку та закінчуються серединою 
стаціонарної частини після наступного звуку |71. 

5. Сегментивний -- синтез із одиниць конкатенації довільного розміру. 

Слово розкладається на три частини -- початкову (префіксну), внутрішню та кінцеву 
(суфіксну). В множинах сегментів містяться як наголошені сегменти, так і ненаголошені. 
А слово подається послідовністю певних сегментів, які вже містять в собі просодику 
слова. Самі ж сегменти вибираються (із відповідної множини сегментів) якнайбільшими, 
тобто такими, що складаються з якнайбільшої кількості фонем. Це зменшує кількість 
конкатенацій сегментів та підвищує природність звучання синтезованої мови. 

Розглянемо математичну модель подання текстової інформації для конкатенатив- 
ного сегментивного синтезу української мови, запропоновану в (1): 


Миру УРА (1) 
де м, Є ИЙ, МІ є М - слово із простору слів української мови //, 5, є 5, У; є М - деякий 
початковий сегмент із множини початкових сегментів 5, ії) - деякий (певний для 
кожного конкретного слова) послідовний набір внутрішніх сегментів і, є /, Ут є М із 
множини внутрішніх сегментів /, /, є К,УК є М -- деякий кінцевий сегмент із множини 
кінцевих сегментів Й, 5,4Ї,,» /, Є 0, У/, т, К є М, де О - простір всіх сегментів українсь- 


КОЇ МОВИ. 

Наведена модель дозволяє істотно підвищити швидкість роботи систем звукового 
синтезу мовної інформації завдяки відносній простоті концепції та зручності обробки 1 
доступності елементів синтезу (3). 

На рис. 1 зображено врахування властивостей звучання різних мовних елементів 
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для об'єкта синтезу відповідно до моделі (1): 


Початкові сегменти Внутрішні сегменти Кінцеві сегменти 


Частини слів, котрим Частини слів, котрим Частини слів, котрим 
властиві характеристики | | властиві характеристики | | властиві характеристики 
початків слів середин слів кінця слів 


Послідовність сегментів 


Рисунок 1 - Схема слова як об'єкта синтезу для конкатенативного сегментивного синтезу 
української мови 

Такі одиниці синтезу вибираються для того, щоб уникнути складності штучного 
моделювання процесів коартикуляції завдяки адекватному відтворенню просодичних 
властивостей природних мовних сигналів. 

Основні наукові зусилля з області розробки систем синтезу природної мови без 
модифікації елементів мови спрямовані на вдосконалення баз елементів синтезу та алго- 
ритмів сегментації для покращення характеристик природності звучання та просодичного 
оформлення синтезованої мови. 

Частина елементів синтезу може володіти спільними для декількох мов фонемними 
та просодичними характеристиками, але розробляти мультимовні системи синтезу Зі 
звучанням мови аналогічним природному можна лише при використанні сучасних мате- 
матичних моделей та алгоритмів модифікації вхідних елементів синтезу. Наприклад, засо- 
бами модифікації періодів основного тону, так званими Р5ОЇ А-методами (|З). 


Об'єктно-елементна модель подання інформації для 
конкатенативного сегментивного синтезу української мови 


Роль слова як центральної одиниці мови зумовлюється залежністю інших одиниць 
мови від слова та системними відношеннями зі словом. Дедалі більше лінгвістів визнають 
правильним твердження про те, що саме слово є основною одиницею мови | 10). 

Часто в розмовній мові послідовність фонем, що відповідає слову, не співпадає з 
послідовністю літер, відповідних фонемам. Тобто, відрізняється від буквальної конкате- 
нації фонем. Це явище називається несвідомою фонетизацією і відбувається в силу ряду 
причин, в тому числі і фонетично обумовлених: 

- дзвінкі 1 глухі приголосні, взаємодіючи у мовному потоці, можуть уподібнюватися один 
одному, що відповідно відображається у вимові; 

- приголосні, в залежності від оточуючих фонем, можуть вимовлятися м'яко; 

- при збігові кількох приголосних у вимові один із них випадає, тобто відбувається спро- 
щення приголосних; 

-- приголосні можуть подовжуватися; 

- голосні, в залежності від наголошеності та оточуючих їх інших голосних, можуть 
вимовлятися як чітко і «неспотвореними», так і, в силу вокалізованої природи голосних 
звуків, з наближенням до інших голосних. 

В описаній задачі мінімальним семантично повним носієм інформації є слово. Це 
підказують і результати фонетичних досліджень, які показали принципову залежність 
просодичних характеристик звучання мови від їх розташування в слові | 11. 
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Розглянемо об'єктно-елементну модель подання інформації, наведену на рис. 2. 


поз гу)|  Техі(5Е) 
Техі (50) 15к) РА РР 

- БУ) МИТл5 (5Е) 
1л81(50) Множина | | || | || || ||| "| Множина у 
ЕК(50) у 

Лидіо (ЗЕ) 


Рисунок 2 - Схема об'єктно-елементної моделі подання інформації 


Об'єкт синтезу (слово) подається послідовною множиною елементів синтезу (5Б/. 
Кожний елемент синтезу 5Е має таку структуру - текстове подання елементу синтезу 
Тех (5Е) є О; список слів, в яких міститься елемент синтезу Й/1.151(5Е) - у», п де 
і є Му є Й/ ; рейтинг, тобто кількість слів, в яких міститься елемент синтезу К(5Е), зву- 
кове подання елементу синтезу Аиаїо(5Е). Кожний об'єкт синтезу 50 має таку струк- 
туру - текстове подання об'єкта синтезу Техі(50) є Й ; послідовний список елементів 
є І,Ут є М), 


лєБМКЄМ, 5, Є 0, У), т, К є М г рейтинг, тобто кількість елементів синтезу, які 


синтезу, які складають слово Й//.І51(50) 5, г юбув 5 УРЕМ і 


складають слово К(5Е). 


Структура об'єктів та елементів синтезу бази даних 
системи конкатенативного сегментивного синтезу 
української мови 


Конкатенативні синтезатори залежать від мовних баз даних. Чим більший об'єм 
мовної бази даних, тобто чим повніше подана в ній звукова, інтонаційна, темпоральна 
варіативність мови, тим більшу природність звучання можна отримати в синтезованій 
мові (121. 

Наведемо спрощений приклад аналізу структури об'єктів синтезу (табл. 1) та еле- 
ментів синтезу (табл. 2) бази даних системи конкатенативного сегментивного синтезу ук- 
раїнської мови на прикладі фрази «Об'єктно-елементна модель подання інформації для 
конкатенативного сегментивного синтезу української мови». 


Таблиця 1 - Структура об'єктів синтезу бази даних системи конкатенативного 
сегментивного синтезу української мови 


Об'єкт синтезу Впорядкований список сегментів Кость К-сть літер 
сегментів 

об'єктно Но,б'є , к, т, но? 5 7 
елементна Не, ле, ме нт, на" 4 9 
модель Ямо, де , ль? 3 6 
подання Япо, да, ння 7 3 7 
інформації тн, фо, р, ма , ції? 5 10 
для Ядля 7 1 3 
конкатенативного Яко, н, ка, те, на, ти , в, ного" 8 16 
сегментивного Ясе, г, ме, н,ти , в, ного" 7 13 
синтезу Яси , н, те, зу" 4 7 
української Ну, к, ра, Ї , н, ської" 6 11 
мови Ямо ,ви? 2 4 
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Основною, для конкатенативного сегментивного синтезу, характеристикою об'єкта 
синтезу є впорядкована послідовність його елементів синтезу. Адже основні мовні влас- 
тивості та особливості звучання, якими оперує метод конкатенативного сегментивного 
синтезу, вже закладені саме в елементах синтезу згідно з парадигмою створення їх множини. 


Таблиця 2 - Структура елементів синтезу бази даних системи конкатенативного 
сегментивного синтезу української мови 


Мо| Елемент | Список К-сть | К-сть | Хо | Елемент| Список К-сть | Кость 
синтезу | об'єктів | об'єктів | літер синтезу | об'єктів | об'єктів | літер 
синтезу синтезу 
1|Ядля 72 0 |для 1 3 |20|зу" синтезу 1 2 
2 |йської"  |української 1 5 |21 ви" мови 1 2 
3 |ме нт елементна 1 4 12210 об'єктно 1 1 
4 |ння 7 подання 1 3 123 Не елементна 1 1 
5 |ного? конкатена- 2 4  124(|ле елементна 1 2 
тивного 
сегментив- 
ного 
6 |б'є об'єктно 1 2  |25|да подання 1 2 
7 (ції? інформації 3 126|фо інформації 1 2 
8 |Нси синтезу 1 2 127 ка конкатена- 1 2 
тивного 
9 |Ямо мови 1 2 128 те конкатена- 2 2 
тивного 
синтезу 
1Она?" елементна 2 2  129Їна конкатена- 1 2 
тивного 
1Цно? об'єктно 1 2 130|ме сегментив- 1 2 
ного 
121Нмо модель 1 2 |3їну української 1 1 
ІЗіде модель 1 2 |3Дра української 1 2 
14їль? модель 1 2 БО української 1 1 
15ДЯпо подання 1 2 134к об'єктно 2 1 
української 
16 Ян інформації 1 25 (39 об'єктно 1 1 
І71ма інформації 1 2 |36р інформації 1 1 
18 |Нко конкатена- 2 137н конкатена- 4 
тивного тивного 
Іти конкатена- 2 2 сегментив- 
тивного ного 
сегментив- синтезу 
ного української 
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З табл. 3 видно, що більшість сегментів одночасно враховує декілька характеристик 


Таблиця 3 - Аналіз характеристик елементів синтезу бази даних системи 
конкатенативного сегментивного синтезу української мови 


Мо | Характеристики природності звучання сегментів Сегменти 
1 | Наголошеність голосних (в усіх наголошених б'є , ме нт, де , ння 7, 
сегментах) ма , Ядля 7, ти , жи ,Її, 
Нмо 

2. | Врахування природних переходів від приголосних в усіх сегментах з 

до голосних приголосними 

3 | Просодичні характеристики звуків на початку слів Но, йе, ймо, Япо, Яін, 
Ядля 7, Яко, се, Нси , НУ, 
мо 

4. | Просодичні характеристики звуків в середині слів б'є , к, т, ле, ме нт, де, 
да, фо, р, ма ,н, ка, те, на, 
г, ме, ти ,в,ра, Її, 

5 | Просодичні характеристики звуків в кінці слів но", на?, ль", ння 7, ції", 
Ядля 7, ного", зу", 
ської", ви?" 

6 | Врахування характерних властивостей б'є , ль?, ської?" 

пом'якшеності приголосних 

7. | Врахування характерних властивостей звучання ме нт 

морфологічних конструкцій 

8 | Врахування характерних властивостей звучання ння 7 

подвоєння приголосних 

9. | Врахування характерних властивостей взаємовпливу | ської", ме нт, ння 7 

приголосних звуків 
Висновки 


Розглядається модифікований підхід до вибору елементів синтезу української мови. 


Новизна підходу полягає у використанні запропонованої у статті об'єктно-елементної 
моделі синтезу для створення зв'язків між об'єктами синтезу (словами) та елементами 
синтезу. Описана модель обгрунтовує використання слова як центральної одиниці інфор- 
мації, оскільки слово є мінімальним семантично повним носієм інформації та залежить 
від фонетичних коартикуляційних властивостей елементів мови. Наведена модель дозво- 
ляє уникнути складності штучного моделювання процесів коартикуляції завдяки відтво- 
ренню просодичних властивостей природних мовних сигналів. На тестовому прикладі 
розглянуто використання об'єктно-елементної моделі подання інформації для конка- 
тенативного сегментивного синтезу української мови. 


Подальші дослідження будуть направлені на створення множин та мовних баз 


даних (текстових і звукових) об'єктів та елементів синтезу (сегментів) 1 текстового корпу- 
су для задачі конкатенативного сегментивного синтезу української мови. 
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Н.Н. Шатковский 

Обьектно-злементная модель подачи информации для задачи конкатенативного сегментивного 
синтеза украинской речи 

В статье приводится модель подачи информации для задачи конкатенативного сегментивного синтеза 
украйнской речи. Демонстрируется подход в вьтборе обьектов и злементов синтеза. Анализируется 
структура обьектов и злементов синтеза базьт данньх системьт конкатенативного сегментивного 
синтеза украйнской речи. 
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